数据分析构成了统计的基础。数据分析在当今的商业世界中至关重要,因为数据公司从市场中收集到的影响会影响到他们做出的每一个决定。相关系数公式是在统计基础上形成观点的最佳方法之一。
排序数据
通过研究获得的数据通常会转换为数字形式,以便可以对数据进行进一步的计算,并且变得易于处理。处理和分析数据的一些常用方法包括对数据变量进行排名,将它们组织在图表上,将它们分类为不同的类别以及计算所收集数据变量的平均值,众数和中位数。
了解数据变量
我们不断提到的这些数据变量是什么?它们可以是任何东西,例如一个人的身高,一个人的年龄或诸如帖或篮球之类的物品。为什么这些数据变量相关?显然,一个孩子比大人吃的帖更多。但是,孩子打篮球的程度可能不及青少年或成人。人的年龄和所消耗的帖之间的数据变量之间存在反比(负)关系-随着人的年龄增长,他所消耗的帖减少。但是,一个人的年龄与打篮球所花费的时间之间存在直接(正)关系,一个人随着年龄的增长会打更多的篮球。
如果您是一家生产帖或篮球的公司,则需要了解这些数据变量之间的关系,以便可以将产品定位到特定人群。
使用相关系数公式:查找数据变量之间的关系
相关系数公式是统计中非常有用的公式。它可以帮助您以-1到+1的比例计算两个数据变量之间的关系。如果结果为+1,则意味着您的两个变量是完美的正匹配(这种情况很少发生)。如果结果为0,则变量根本不匹配。如果结果为-1,则变量为负匹配。
让我们继续使用帖和篮球示例。在这种情况下,我们将具有三个工作变量:年龄,消耗的帖和打篮球。如果我们用相关系数公式计算年龄与食用帖之间的关系,则相关系数的值将在0到-1的范围内。为什么?因为这两个变量之间存在反比关系!一个人年纪越大,他或她消耗的帖就越少。如果将这两个点绘制在图形上并画一条线,它将具有负斜率。
如果我们要计算年龄和篮球的相关系数,则该系数为正,介于0和1之间。在图形上,您从(0,0)绘制的线将具有正斜率。
相关系数(也称为Pearson乘积矩相关系数)不过是两个变量x和y之间的依存关系的度量。在我们的示例中,变量x将是年龄,变量y将是帖(或篮球)。切换数值周围的值可以是y,帖或篮球的值可以是x都没关系。相关系数仍然具有相同的值(它将仍然占据图形上的相同位置)。
相关系数公式解释
相关系数公式如下:
(r)= [nΣxy–(Σx)(Σy)/ Sqrt([nΣx2–(Σx)2] [nΣy2–(Σy)2])]]
看起来复杂吗?让我们分解一下:
r:相关系数用字母r表示。
n:值的数量。如果我们有五个人,我们正在计算相关系数,则n的值为5。
x:这是第一个数据变量。
y:这是第二个数据变量。
Σ:Sigma符号(希腊语)告诉我们计算其旁边标记的任何东西的“和”。
示例:让我们计算一组数据的相关系数,以帮助您更好地理解公式。通常,如果输入数据变量,大多数计算器(科学计算器)会自动计算系数,但是您应该在纸上尝试几次,这将有助于您更好地理解这一概念。让我们以孩子的年龄作为我们的x变量,将消耗的帖作为y变量。假设经过研究,我们发现随着孩子的长大,他们吃的帖减少了。以下是我们为三个孩子(或一个孩子在其生命的三个阶段)收到的数据变量的值。
x(儿童年龄) |
Y(帖消耗) |
6 |
10 |
7 |
9 |
8 |
8 |
步骤1:找到我们需要的所有值
在这里,n(x和y中的变量数)将为3。
X |
ÿ |
y |
2倍 |
22 |
6 |
10 |
60 |
36 |
100 |
7 |
9 |
63 |
49 |
81 |
8 |
8 |
64 |
64 |
64 |
我们需要的其他值是:
Σx= 6 + 7 + 8 = 21
Σy= 10 + 9 + 8 = 27
Σxy= 60 + 63 + 64 = 187
Σx2= 36 + 49 + 64 = 149
Σy2= 100 + 81 + 64 = 245
步骤2:将值输入公式
(r)= [nΣxy–(Σx)(Σy)/ Sqrt([nΣx2–(Σx)2] [nΣy2–(Σy)2])]]
r = [3(187)–(21)(27)/ Sqrt([3(149)–(21)2] [3(245)-(27)2])]
r = [561-567 / Sqrt([447-441] [735-729])]
r = [-6 /平方([6] [6])]
r = [-6 /平方(36)]
r = -6 / 6
r = -1
说明
我们获得的相关系数是完美的负1。这表明我们的两个变量之间存在完美的负(逆)匹配。随着一个变量的值增加,另一变量的值下降。实际上,会有一些孩子年轻时不吃帖,一些孩子年轻时不吃帖,以及在不同年龄吃不同量帖的孩子。因此,系数的值可能几乎永远不会为-1-而是介于0到1之间。
当然,我们以一个相对简单的示例向您展示了数据分析并不像看起来那么难!您可以应用相同的原理来分析各种业务情况下的数据。
-
无相关信息